約 3,867,973 件
https://w.atwiki.jp/darong/pages/123.html
■優子ちゃん記事の矛盾 http //www.tanteifile.com/diary/2003/12/29/index.html (来年のスパイニュース) 自殺失敗しました。親に、「おまえが死んだら警察に疑われるし、迷惑だ」と言われました。dさん 【脂の返事】 あなたが死のうが生きようが私の知ったことでは ありません。でも、親の言うとおりです。ちゃんと遺書を書い て、他殺と疑われない方法で命を絶ってください。よく親御 さんから依頼があって調査をしますが、他殺だか自殺だか分か らないような死に方は、周囲にも司法にも大迷惑です。 あれ?優子ちゃんの日記に似たような記述があったような・・・ http //www4.diary.ne.jp/logdisp.cgi?user=411810 log=200312 2003/12/13(土)の日記に記載されている母親の言葉より一部抜粋 「あんたが死んだら余計迷惑だ。殺人や、虐待に間違えられ るかもしれない。葬式や、検死や解剖も迷惑だ。」 そういや優子ちゃんが脂に送ったメールにも・・・ http //www.tanteifile.com/diary/2004/01/28_01/index.html 首吊って自殺未遂した。親に言われた。 ●お前が死んだら余計迷惑 ●虐待とか殺人と間違えられたらどうしてくれるんだ ●検死とか解剖とか葬式やらなきゃいけないから迷惑だ 結局12月29日の記事の3日後に優子ちゃんが遺書を書い て自殺をはかる(1月1日深夜)優子ちゃんが亡くなった後 は死人に口無しとばかりにやりたい放題。 優子ちゃんの死を知った夜 http //www.tanteifile.com/diary/2004/10/26_01/index.html 本当はえりすの歓迎会。最後の脂のにやにやした表情が印象的。 らぶれすのえりすの日記や以下の探偵ファイルの記事から 歓迎会時の写真であることが分かる。えりす歓迎会と全員同じ服。 別の日にみんな同じ服着てくる事なんて確率的に殆ど無い。 http //www.tanteifile.com/baka/2004/02/04_01_erisu_01/ 「大声で怒鳴り散らした山木 」と言ってますが下記では 「優子ちゃんと一切面識が無い」? http //www.tanteifile.com/diary/2004/02/17_01/index.html 01月02日午後--Wが優子ちゃんの死を知った日 【ソース→Wが書いたとされる記事】 >彼女が逝った日の午後、私宛に一通の手紙が届きました。 01月26日?---えりす誕生会をした日? 01月28日-----「少女の死」UP ∟ Tファイル上で優子さんの死が報告された日 > 昨日(27日)の意味不明なポエムに面食らった人も多いだろう。 > 私の心が大きく乱れた日。 > 自分の胸にしまっておこうとした何か。 九坪東京へ来る 02月04日------ えりす誕生会記事UP 10月26日---- 「優子ちゃんの死を知った夜」UP ∟誕生会と同じスーツとネクタイのW、 えりすはVネックとボートネックで違く見える
https://w.atwiki.jp/kotya/pages/9.html
設定ファイル関係 設定ファイル関係主な設定ファイル一覧アクセス関係 起動・ログイン関係 ファイルシステム システム管理 ネットワーク システム系コマンド デーモン ユーザー向け設定ファイル [#q5230c51] 参考 主な設定ファイル一覧 参考:Understanding Linux configuration files アクセス関係 マシンへのアクセスを制御する設定ファイル。 ファイル名 コメント Manページ /etc/host.conf IPアドレスの名前解決方法の設定(今は殆ど使われてない) host.conf.5 /etc/nsswich.conf 名前解決等の手段を設定 /etc/hosts IPアドレスとホスト名の対応付け hosts.5 /etc/hosts.allow アクセス許可設定 hosts_access.5 /etc/hosts.deny アクセス拒否設定 hosts_access.5 起動・ログイン関係 ブート・ログイン時の処理を決定する設定ファイル。 ファイル名 コメント Manページ /etc/issue, issue.net ログイン前に表示される注意書き issue.5, issue.net.5 /etc/rc.d/rc /etc/rc.d/rc.local ローカル用の起動設定 /etc/rc.d/rc.sysinit システム用の起動時初期化設定 /etc/rc.d/rcX.d ブートアップ時・終了時に実行するスクリプトを入れるディレクトリ、ランレベル別 ファイルシステム ファイルシステム関連の設定ファイル。 ファイル名 コメント Manページ /etc/mtab 現在マウントされているファイルシステムの情報 /etc/fstab マウントするファイルシステムの情報 fstab.5 /etc/mtools.conf DOS用ユーティリティ向け設定 システム管理 システム管理者向けの設定ファイル。 ファイル名 コメント Manページ /etc/group グループ設定 group.5 /etc/nologin root以外のログインの禁止を示すファイル nologin.5 /etc/passwd ユーザアカウント情報の設定ファイル passwd.5 /etc/rpmrc RPMコマンドの設定 /etc/securetty rootがログインできる端末の設定 securetty.5 /etc/usertty /etc/shadow 暗号化パスワード shadow.5 /etc/shells シェルとして認識されている物の一覧 shells.5 /etc/motd ログイン後に表示されるお知らせ motd.5 ネットワーク ネットワーク関係の設定ファイル。 ファイル名 コメント Manページ /etc/gated.conf /etc/gated.version /etc/gateway /etc/protocols プロトコル定義。変更禁止 protocols.5 /etc/resolv.conf ネームサーバーなどの設定 resolv.conf.5 /etc/rpc RPC向けデーターベース。NFS用 rpc.5 /etc/exports エキスポートされるファイルシステム。NFS用 exports.5 /etc/services インターネットサービスリスト services.5 /etc/inetd.conf スーパーサーバ設定ファイル /etc/sendmail.cf Sendmailの設定(かなり古いバージョンです) /etc/sysconfig/network ”システムの”ネットワーク関連設定 システム系コマンド システム関係のコマンドの設定ファイル。 ファイル名 コメント Manページ /etc/lilo.conf ブートローダーLILOの設定 /etc/logrotate.conf ログのロテート(シフト)の設定 /etc/identd.conf /etc/ld.so.conf ダイナミックリンカーの設定 /etc/inittab ブートアップ時・終了時に実行する処理。UNIXで最初に読まれる設定です。 inittab.5 /etc/termcap 端末設定ファイル デーモン デーモンの設定ファイル。 ファイル名 コメント Manページ /etc/syslogd.conf システムログデーモンの設定 /etc/httpd.conf Apache HTTPサーバーデーモンの設定(旧バージョン) /etc/modules.conf 読み込むカーネルモジュールの設定ファイル ユーザー向け設定ファイル [#q5230c51] 個別ユーザー向け、設定・初期化ファイル。 ファイル名 コメント Manページ 書式 ~/.bash_logout ログアウト時に読み込むBashの後始末ファイル Bashスクリプト ~/.bash_profile ログイン時に読み込むBashの初期化ファイル Bashスクリプト ~/.bash_history Bash コマンドの履歴ファイル Bashスクリプト ~/.bashrc 起動時に読み込むBashの設定ファイル Bashスクリプト 参考 /etcナビゲーション Gentoo ドキュメント OpenSUSE Documentation JM Project
https://w.atwiki.jp/nveiept/pages/22.html
スレに投下されたファイルは以下のように管理します。 ★投下するファイルは携帯でも閲覧可能なアップローダを利用します。 ★スレに投下されたファイルはリネームして、専用アップローダに上げ直します。 ★上げ直したファイル名のフォーマットは以下の通りです。 スレ_スレ番.拡張子 複数のファイルがある場合、スレ_スレ番_通し番号.拡張子 ※1スレ目でレス番が10であれば「1_10.jpg」 ※複数ファイルがあり、そのファイルが上から2番目であれば「1_10_2.jpg」 ★コメントの再編集が可能なように編集パスワード(vip)を設定してください。 ★専用アップローダに上げ直したファイルはファイル管理表で管理します。 ファイル管理表 現管理表 https //spreadsheets.google.com/ccc?key=0AvW1T4M1cqI7dFotOEIxU0FVbXBtQmpYV1dlQk00aXc authkey=CPaAlSY hl=ja pli=1#gid=0 (旧管理表) http //ux.getuploader.com/ugo/download/55/FileList.xls 元データ名 元データ名を記載。 完成データ名 完成データ名を記載。 詳細 ファイルの詳細を記載。 状態 「未着手」「作業中」「中断」「完成」のいずれかを記載。 コメント 連絡事項、指示を記載。 カテゴリ ファイルのカテゴリを記載。 作業区分 「新規」「修正」のいずれかを記載。 該当SS 該当するSSのタイトルを記載。 作業担当 現在の作業担当者を記載。名無しの場合はIDを記載。 格納先 完成データの格納先リンクを記載。 ※完成データはリネーム後、「完成データ名」を記載して、専用アップローダにアップする。 (BMPはサムネイル表示出来ないので、容量節約のためzip圧縮推奨) ※ファイルへのリンクを「格納先」に記載する。 ★wikiへは完成データが画像の場合、BMP形式となるため、そのままでは 表示出来ないので、サンプルとしてPNG形式に変換してから掲載します。
https://w.atwiki.jp/aster-infra/pages/148.html
ext2 Linux用ファイルシステムextを拡張したファイルシステム ext3 ext2にジャーナリング機能を加えたファイルシステム reiserfs Linux用のジャーナリングファイルシステム jfs IBMによって開発されたジャーナリングファイルシステム xfs SGIによって開発されたジャーナリングファイルシステム iso9960 CD-ROMのファイルシステム udf DVD等のファイルシステム msdos MS-DOSのファイルシステム(FAT) vfat Windows 95/98のファイルシステム ntfs Windows NT/2000以降で採用するファイルシステム hpfs OS/2のファイルシステム(High Performance Filesystem) hfs MacOS 8以降のファイルシステム(NFS) hfs ネットワークファイルシステム(NFS) smbfs Windowsのネットワーク共有を扱うファイルシステム cifs Windowsのネットワーク共有を扱うファイルシステム(Windows 2000以降) tmpfs プロセス情報を扱う仮想ファイルシステム sysfs デバイス情報を扱う仮想ファイルシステム tmpfs 仮想メモリベースのファイルシステム devpts 疑似端末を制御するための仮想ファイルシステム usbfs USBデバイス監視用のファイルシステム cramfs 組み込みシステムなどで使われる圧縮ファイルシステム
https://w.atwiki.jp/ocg-o-card/pages/611.html
バックファイア 通常罠 相手が魔法カードの効果を使用した時に発動可能。 相手の手札をランダムに1枚破壊する。 Part13-355 名前 コメント
https://w.atwiki.jp/kandoushita/pages/92.html
LikeGrep Locate32 Everything HandySelector Fileseeker3 ここを編集 名前 妖滅堂 - 名無しさん 2011-02-14 00 20 48 motogp - 名無しさん 2010-06-22 01 13 25 仕事 - 名無しさん 2010-05-12 23 17 01 [部分編集] 518 名無しさん@お腹いっぱい。 [sage] 2009/07/25(土) 17 53 00 ID jRjN84cg0 LikeGrep 【機能】 grep検索 【リンク】 http //www.vector.co.jp/soft/winnt/util/se475489.html 【コメント】正規表現がわからなくてもGrep検索が出来る。 Googleデスクトップを止めてEverythingを検索に使っているんだけど、 たまに全文検索をしたくなるときがあって、そういうときに役に立つ。 .NET2.0必須だけど、正規表現何それウマイ?な俺には結構便利。 [部分編集] 199 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/02/28(木) 16 01 26 ID FAx0iqht0 Locate32 【機能】 ファイル名検索 【リンク】 http //www.gigafree.net/utility/desksearch/locate32.html 【コメント】 全HDDから高速でファイル名検索を行うソフト 今までfenrir、AvaFindと使ってきたがこのソフトはさらに便利 サイズ・更新日時指定、特定のフォルダ以下から検索、MD5計算、リムーバブルメディアのファイルリストを保持・検索 Explorerと同等以上の詳細表示、右クリックメニュー などが使える +... ▼ 207 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/03/02(日) 15 58 40 ID b2E5C/gY0 >>199 Perl5互換の正規表現は使えますか? ▼ 208 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/03/02(日) 18 23 20 ID mzRvY9jj0 >>207 正規表現は使えないけどワイルドカードが使える。 ▼ 680 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/08/01(金) 00 09 47 ID G4e9J1Cg0 >>199 これ便利だ、感動した! ▼ 694 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/08/02(土) 16 33 25 ID NAO0OGZ50 最近では>>3か>>199がヒットだ ▼ 695 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/08/02(土) 20 20 03 ID SB/r9uMA0 >>199はいいけど、余分すぎ fenrirで検索してあふで開けばいいし 連携できる方がいいわ ▼ 697 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/08/02(土) 20 42 10 ID mziUgnGN0 >>695 連携できるぞ。 いろんな絞込みもできるし、Unicodeにも対応してる。 [部分編集] 142 名無しさん@お腹いっぱい。 [sage] 2008/10/06(月) 01 30 04 ID xKaKEJJc0 Everything 【機能】ファイル検索 【リンク】http //www.voidtools.com/ 【コメント】データベース型で常駐でファイル監視してくれるのでいちいちアップデートしなくてもよい。どの部分でも一部一致でインクリメンタル発動。軽い。unicode対応してくれたらなぁ。 +... ▼ 481 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/11/10(月) 04 15 38 ID RWBgzC/80 >>478 >>142 日本語がマトモに扱えない ▼ 482 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/11/10(月) 04 32 31 ID 3jfdzugy0 >>481 Downloadの方にある1.2.0 Betaだったら日本語も大丈夫 ▼ 844 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/12/10(水) 23 42 17 ID j3W9zQMx0 >>142 フォーマットできんと思ったら原因こいつだった 214 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/05(月) 19 30 28 ID Ia10PwHi0 【ソフト名】Everything 【機能】ファイル検索 【リンク】Everything ファイル検索 でぐぐると見つかる 【コメント】 最近どっかのスレで紹介されてたんだけど、ここだっけ? 速すぎて鼻水でた。 ファイル管理はきっちりやってるんだけど、咄嗟にどこか忘れちゃったりしたときに使う。 あとファイラで深い階層のフォルダを開くときにこっちから開いた方が速いって時もある。 それくらい速い。 「Windows Searchなんてサービスごと切ってるよ」 「検索するくらいならちゃんと管理しろ」 「ショートカット作ればいいじゃん」(でもデスクトップには何も置きたくない) なんて人にもおすすめできる。 FileSeeker(だったっけ?)もなかなか良かったけど、こっち試してみたらもう手放せない。 感動したわー。速くて。 ▼ 215 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/05(月) 19 40 52 ID MOPoMHPU0 >>214は要らんな ▼ 216 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/05(月) 19 44 05 ID 0w2gygEP0 >>214 速いけど、英語でよく分からん Janeのコマンドに登録して検索とか出来ないのかな? ▼ 221 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/05(月) 20 11 54 ID OKjvUL4G0 >>214 検索漏れ多すぎてゴミ ▼ 222 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/05(月) 20 21 37 ID ptf/VqR/0 >>221 OSはVista? 688 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/28(水) 19 50 27 ID vKgJVG+50 【ソフト名】Everything search engine 【機能】 ファイル検索 【リンク】 ttp //www.gigafree.net/utility/desksearch/everything.html ttp //pc11.2ch.net/test/read.cgi/software/1227538496/ 【コメント】 速い  「_restore」でシステムの復元のフォルダも検索できました ▼ 689 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/28(水) 20 32 05 ID Y+WJGa6I0 >>688 なるほど、データベース化するのか ▼ 690 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/28(水) 21 40 24 ID vKgJVG+50 >>689 いや、データベースを使うLocate32も便利ですが これは直接NTFSのMaster File Tableを見るらしいです 新規作成→即検索されて凄いと思いました ▼ 691 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/28(水) 22 24 19 ID gAfhA8yv0 >>688 これ外付けハードディスクを読み込まないのでダメだね といことでLocate32をお勧めします ▼ 692 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/28(水) 23 28 43 ID vKgJVG+50 >>691 NTFSなら見に行くと思うんですが このためにフォーマットするならLocate32のがいいですね ▼ 695 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/01/28(水) 23 53 24 ID Tt9R3UsL0 >>688 これスゴイね 本当に感動した 138 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/10(金) 22 34 31 ID RfKOeZbB0 ■紹介用テンプレ 【ソフト名】Everything 【機能】 デスクトップ検索 【リンク】 ttp //www.gigafree.net/utility/desksearch/everything.html 【コメント】 笑っちゃうほど速いファイル検索ソフト。 迷子になったファイルをあっという間に見つけられる。 ▼ 341 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/26(日) 23 35 08 ID 1y8B9quK0 >>138 これはほんとに速くて笑った ▼ 346 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/27(月) 00 20 31 ID 2mqnDff00 >>341 爆速だよな 俺も常用してる ▼ 350 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/27(月) 04 37 01 ID Ooqls/sYP >>341 vistaの検索機能とどっちが早いの? ▼ 351 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/27(月) 04 46 55 ID YFLajJRHP >>350 比べものにならん。 俺の環境じゃどんな検索でも1秒以下で出る。 ▼ 354 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/27(月) 05 31 29 ID Ja1tRXEB0 >>350 俺のvista環境だと vistaなんか比べものにならないくらい早いよ。 vistaの検索画面出すだけでもたつくし 174 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/10/21(水) 10 54 51 ID 9NlJZoI30 【ソフト名】 Everything 【機能】 ファイル検索(インデックス) 【リンク】 http //www.voidtools.com/ 【コメント】 初期設定で検索場所指定してからのインデックス作成速度が異常に速い(131,109ファイルで約4秒) googleデスクトップから即乗換決定 ▼ 175 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/10/21(水) 14 19 32 ID 5BhbaMvE0 >>174 ひとつだけ問題点(といってもいいものか)がある。 書き込み中のファイルがあった時、そのファイル作成時の書き込み中の ファイルサイズで登録され、その登録はEverything再起動するまで更新されない。 Everything起動中に大量コピーなんかすると、表示上1KBのファイルがズラーっと 検索画面に並ぶことになる。 再起動しても十分過ぎるくらいに速いからたいした問題でも無いけど。 [部分編集] 474 名無しさん@お腹いっぱい。 [sage] 2008/06/10(火) 02 00 25 ID esIITNbJ0 HandySelector 【.. 機能...】 指定文字列を名前に含むファイルを一括選択・絞り込み表示 【 リンク .】 http //www.geocities.jp/geek_na_heya/ 【コメント.】 窓の杜 - HandySelector http //www.forest.impress.co.jp/lib/sys/wincust/explrextn/handyselect.html +... ▼ 476 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/06/10(火) 08 13 18 ID rXx1wBT60 >>474 いいねこれ ▼ 477 名前:番組の途中ですが名無しです[sage] 投稿日:2008/06/10(火) 11 05 37 ID msfC1+BP0 >>474 使ってみたいな どこからDL出来るの? ▼ 478 名前:477[sage] 投稿日:2008/06/10(火) 11 07 14 ID msfC1+BP0 失礼 ベクターからDLできました ▼ 482 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/06/10(火) 21 11 19 ID jZZtSLgp0 >>474 こりゃイイぜ ▼ 492 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/06/12(木) 21 12 45 ID hNuy6KiN0 >>474が一番 ▼ 496 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2008/06/20(金) 17 46 23 ID 1yQu0ERa0 >>474 ファイラ使ってれば必要なし [部分編集] 442 名無しさん@お腹いっぱい。 [sage] 2009/01/18(日) 01 09 07 ID 7fRI0iyH0 Fileseeker3 【機能】ファイル検索 【リンク】http //hp.vector.co.jp/authors/VA038378/ 【コメント】ちょっと前に開発再開した新バージョン 最近の更新で、前に出てたEverythingが起動してればそのデータベースが使えるようになった 速い+使いやすい。 ただしまだα版
https://w.atwiki.jp/biosix/pages/72.html
ファイル・レオン編? ファイル・クリス編? ファイル・ジェイク編? ファイル・エイダ編?
https://w.atwiki.jp/gdgdtime/pages/46.html
更新ファイル データのアップデートに伴って更新されるファイル郡。 実行ファイル他 gdgdTime.exe(2012/05/20) DATA.ini (2012/05/21) data.rar (2012/05/20) GRFファイル map.grf(2012/05/21) style.grf(2012/05/20) text.grf (2012/05/01)
https://w.atwiki.jp/medadictionary/pages/2370.html
クイックファイア 脚部特性一覧 登場 8 9 クイックファイア 特性概要 特性説明メダロット8、メダロット9 関連項目 特性概要 メダロット8初出の脚部特性。 特性説明 メダロット8、メダロット9 威力40以下の射撃パーツに「連撃」効果が付く。 「連撃」効果を持つパーツをコンボに組み込むと充填性能+10。 関連項目 脚部特性一覧
https://w.atwiki.jp/asterisk99/pages/576.html
original (2019/05/14 付) Google 翻訳 (2019/05/21 付) * Special Data Files * 特殊データファイル * Updated LSTM Data Files for Version 4.00 * [バージョン4.00用のLSTMデータファイルの更新](#バージョン400用の最新の更新データファイル - 9月15日 - 15-2017) * Data Files for Version 4.00 * [バージョン4.00用データファイル](#400用のデータファイル - 11月29日 - 2016年2月) * Data Files for Version 3.04/3.05 * バージョン3.04 / 3.05用データファイル * Cube Data Files for Version 3.04/3.05 * バージョン3.04 / 3.05用キューブデータファイル * Fraktur Data Files * Frakturデータファイル * Data Files for Version 3.02 * バージョン3.02用データファイル * Data Files for Version 2.0x * バージョン2.0x用データファイル * Format of traineddata files * 学習データファイルの形式 ## Special Data Files ##特別なデータファイル Lang Code Description 4.0/3.0x traineddata ラングコード 説明 4.0 / 3.0xトレーニングデータ -------- ---------- ------------------- -------- ---------- ------------------- osd Orientation and script detection osd.traineddata OSDオリエンテーションと台本検出osd.traineddata equ Math / equation detection equ.traineddata equ 数学/方程式の検出equ.traineddata Note These two data files are compatible with older versions of Tesseract. osd is compatible with version 3.01 and up, and equ is compatible with version 3.02 and up. Note これら2つのデータファイルはTesseractの古いバージョンと互換性があります。 osdはバージョン3.01以上と互換性があり、equはバージョン3.02以上と互換性があります。 ## Updated Data Files for Version 4.00 (September 15, 2017) ##バージョン4.00のデータファイルを更新しました(2017年9月15日) We have three sets of .traineddata files on GitHub in three separate repositories. GitHubの3つの別々のリポジトリにある3セットの.traineddataファイルがあります。 * https //github.com/tesseract-ocr/tessdata_best * https //github.com/tesseract-ocr/tessdata_best * https //github.com/tesseract-ocr/tessdata_fast * https //github.com/tesseract-ocr/tessdata_fast * https //github.com/tesseract-ocr/tessdata * https //github.com/tesseract-ocr/tessdata Most users will want tessdata_fast and that is what will be shipped as part of Linux distributions. ほとんどのユーザーは tessdata_fast を望んでいるでしょう、そしてそれはLinuxディストリビューションの一部として出荷されるものです。 tessdata_best is for people willing to trade a lot of speed for slightly better accuracy. It is also tessdata_best は、少し精度を上げるために多くの速度を犠牲にすることを望む人々のためのものです。それも the only set of files which can be used for certain retraining scenarios for advanced users. 上級ユーザー向けの特定の再訓練シナリオに使用できる唯一のファイルセット。 The third set in tessdata is the only one that supports the legacy recognizer. The 4.00 files from November 2016 have both legacy and older LSTM models. The current set of files in tessdata have the legacy models and newer LSTM models (integer versions of 4.00.00 alpha models in tessdata_best). tessdata の3番目のセットはレガシーレコグナイザをサポートする唯一のものです。 2016年11月の4.00ファイルには、従来のLSTMモデルと古いLSTMモデルの両方があります。 tessdata のファイルの現在のセットは、レガシーモデルとより新しいLSTMモデル(tessdata_bestの4.00.00アルファモデルの整数バージョン)を持っています。 Note When using the new models in the tessdata_best and tessdata_fast repositories, only the new LSTM-based OCR engine is supported. The legacy engine is not supported with these files, so Tesseract s oem modes 0 and 2 won t work with them. Note tessdata_best とtessdata_fast リポジトリで新しいモデルを使うとき、新しいLSTMベースのOCRエンジンだけがサポートされます。これらのファイルではレガシエンジンはサポートされていないため、TesseractのOEMモードである「0」と「2」はこれらのファイルでは動作しません。 ## Data Files for Version 4.00 (November 29, 2016) ##バージョン4.00のデータファイル(2016年11月29日) This set of traineddata files has support for the legacy recognizer with --oem 0 and for LSTM models with --oem 1. この一連の学習済みデータファイルは、 - oem 0のレガシーレコグナイザーと--oem 1のLSTMモデルをサポートしています。 Note The kur data file was not updated from 3.04. For Fraktur, see the section Fraktur Data Files, or use the newer data files from the tessdata_fast or tessdata_best repositories. Note kurデータファイルは3.04から更新されていません。 Frakturについては、セクションFrakturデータファイルを参照するか、tessdata_fastまたはtessdata_bestリポジトリから新しいデータファイルを使用してください。 Lang Code Language 4.0 traineddata ラングコード 言語 4.0訓練データ --------- ------- --------------- --------- ------- --------------- afr Afrikaans afr.traineddata AFRアフリカーンス語 afr.traineddata amh Amharic amh.traineddata ああアムハラ語 amh.traineddata ara Arabic ara.traineddata あらアラビア語 ara.traineddata asm Assamese asm.traineddata ASM アッサムasm.traineddata aze Azerbaijani aze.traineddata あぜアゼルバイジャン語 aze.traineddata aze_cyrl Azerbaijani - Cyrillic aze_cyrl.traineddata aze_cyrl アゼルバイジャン語 - キリル文字 aze_cyrl.traineddata bel Belarusian bel.traineddata ベル ベラルーシ語bel.traineddata ben Bengali ben.traineddata ベン ベンガル語ben.traineddata bod Tibetan bod.traineddata ボディーチベットbod.traineddata bos Bosnian bos.traineddata ボスボスニア語 bos.traineddata bul Bulgarian bul.traineddata bul ブルガリア語 bul.traineddata cat Catalan; Valencian cat.traineddata 猫カタロニア語バレンシアcat.traineddata ceb Cebuano ceb.traineddata ceb セブアノceb.traineddata ces Czech ces.traineddata ces チェコces.traineddata chi_sim Chinese - Simplified chi_sim.traineddata chi_sim 中国語 - 簡体字 chi_sim.traineddata chi_tra Chinese - Traditional chi_tra.traineddata chi_tra 繁体字中国語chi_tra.traineddata chr Cherokee chr.traineddata chr チェロキーchr.traineddata cym Welsh cym.traineddata cym ウェールズ語 cym.traineddata dan Danish dan.traineddata ダン デンマーク語 dan.traineddata deu German deu.traineddata デウドイツ語 deu.traineddata dzo Dzongkha dzo.traineddata dzoゾンカdzo.traineddata ell Greek, Modern (1453-) ell.traineddata ell ギリシャ語、モダン(1453-) ell.traineddata eng English eng.traineddata eng 英語 eng.traineddata enm English, Middle (1100-1500) enm.traineddata enm 英語、中(1100 - 1500) enm.traineddata epo Esperanto epo.traineddata エポエスペラントepo.traineddata est Estonian est.traineddata 最新 エストニア語 est.traineddata eus Basque eus.traineddata ユー バスクeus.traineddata fas Persian fas.traineddata fasペルシャ語 fas.traineddata fin Finnish fin.traineddata ひれフィンランド語fin.traineddata fra French fra.traineddata fra フランス語 fra.traineddata frk Frankish frk.traineddata frk フランキー語frk.traineddata frm French, Middle (ca. 1400-1600) frm.traineddata frm フランス語、中級(約1400-1600) frm.traineddata gle Irish gle.traineddata グレアイルランドgle.traineddata glg Galician glg.traineddata glg ガリシア語glg.traineddata grc Greek, Ancient (-1453) grc.traineddata grc ギリシャ語、古代(-1453) grc.traineddata guj Gujarati guj.traineddata guj グジャラート語 guj.traineddata hat Haitian; Haitian Creole hat.traineddata ヘブヘブライ語 heb.traineddata heb Hebrew heb.traineddata ひんヒンディー語 hin.traineddata hin Hindi hin.traineddata hrv クロアチア語 hrv.traineddata hrv Croatian hrv.traineddata フンハンガリー語hun.traineddata hun Hungarian hun.traineddata イクイヌクティットiku.traineddata iku Inuktitut iku.traineddata ind インドネシア語 ind.traineddata ind Indonesian ind.traineddata isl アイスランド語 isl.traineddata isl Icelandic isl.traineddata イタイタリア語 ita.traineddata ita Italian ita.traineddata ita_old イタリア語 - 古いita_old.traineddata ita_old Italian - Old ita_old.traineddata Jav Javジャワjav.traineddata jav Javanese jav.traineddata jpn 日本語 jpn.traineddata jpn Japanese jpn.traineddata かんカンナダkan.traineddata kan Kannada kan.traineddata キャットグルジア語 kat.traineddata kat Georgian kat.traineddata kat_old グルジア語 - 古いkat_old.traineddata kat_old Georgian - Old kat_old.traineddata カズカザフkaz.traineddata kaz Kazakh kaz.traineddata khmセントラルクメールkhm.traineddata khm Central Khmer khm.traineddata キルキルギスキルギスkir.traineddata kir Kirghiz; Kyrgyz kir.traineddata コ 韓国語 kor.traineddata kor Korean kor.traineddata クルクルド人kur.traineddata kur Kurdish kur.traineddata ラオスラオスlao.traineddata lao Lao lao.traineddata 緯度ラテン語 lat.traineddata lat Latin lat.traineddata ラヴラトビア語lav.traineddata lav Latvian lav.traineddata 点灯 リトアニア語lit.traineddata lit Lithuanian lit.traineddata Mal マラヤーラム語mal.traineddata mal Malayalam mal.traineddata 3月マラーティーmar.traineddata mar Marathi mar.traineddata mkd マケドニア語mkd.traineddata mkd Macedonian mkd.traineddata mlt マルタmlt.traineddata mlt Maltese mlt.traineddata msa マレー msa.traineddata msa Malay msa.traineddata ミアビルマmya.traineddata mya Burmese mya.traineddata ネップネパールnep.traineddata nep Nepali nep.traineddata nld オランダの;フランドルnld.traineddata nld Dutch; Flemish nld.traineddata またノルウェー語 nor.traineddata nor Norwegian nor.traineddata オリ オリヤori.traineddata ori Oriya ori.traineddata パン パンジャブ語パンジャブpan.traineddata pan Panjabi; Punjabi pan.traineddata pol ポーランド語 pol.traineddata pol Polish pol.traineddata por ポルトガル語 por.traineddata por Portuguese por.traineddata 膿プッシューパシュトウpus.traineddata pus Pushto; Pashto pus.traineddata ロンルーマニア語モルダビアンモルドバron.traineddata ron Romanian; Moldavian; Moldovan ron.traineddata rus ロシア語 rus.traineddata rus Russian rus.traineddata さんサンスクリットsan.traineddata san Sanskrit san.traineddata 罪シンハラ語シンハラsin.traineddata sin Sinhala; Sinhalese sin.traineddata slk スロバキアslk.traineddata slk Slovak slk.traineddata slv スロベニア語slv.traineddata slv Slovenian slv.traineddata スパスペイン語カスティーリャspa.traineddata spa Spanish; Castilian spa.traineddata spa_old スペイン語カスティーリャ - オールド spa_old.traineddata spa_old Spanish; Castilian - Old spa_old.traineddata sqi アルバニア語 sqi.traineddata sqi Albanian sqi.traineddata srp セルビア語 srp.traineddata srp Serbian srp.traineddata srp_latn セルビア語 - ラテン語 srp_latn.traineddata srp_latn Serbian - Latin srp_latn.traineddata スワスワヒリ語 swa.traineddata swa Swahili swa.traineddata 汗スウェーデン語 swe.traineddata swe Swedish swe.traineddata syr シリアsyr.traineddata syr Syriac syr.traineddata タムタミル語tam.traineddata tam Tamil tam.traineddata tel テルグ語tel.traineddata tel Telugu tel.traineddata tgk タジクtgk.traineddata tgk Tajik tgk.traineddata tgl タガログ語 tgl.traineddata tgl Tagalog tgl.traineddata tha タイ語 tha.traineddata tha Thai tha.traineddata ティルティグリニャtir.traineddata tir Tigrinya tir.traineddata tur トルコ語 tur.traineddata tur Turkish tur.traineddata ウィッグウイグル語ウイグルuig.traineddata uig Uighur; Uyghur uig.traineddata イギリスウクライナ語 ukr.traineddata ukr Ukrainian ukr.traineddata urd ウルドゥー語urd.traineddata urd Urdu urd.traineddata uzb ウズベク語uzb.traineddata uzb Uzbek uzb.traineddata uzb_cyrl ウズベキスタン - キリル文字 uzb_cyrl.traineddata uzb_cyrl Uzbek - Cyrillic uzb_cyrl.traineddata 争うベトナム人 vie.traineddata vie Vietnamese vie.traineddata イードイディッシュ語yid.traineddata yid Yiddish yid.traineddata ## Data Files for Version 3.04/3.05 ##バージョン3.04 / 3.05用のデータファイル Note For Arabic and Hindi you need both the traineddata file and the cube data files. 注意 アラビア語とヒンディー語の場合は、学習データファイルと[キューブデータファイル]の両方が必要です(#cube-data-files-for-version-304305)。 Lang Code Language 3.04 traineddata ラングコード 言語 3.04トレーニングデータ -------- ------- --------------- -------- ------- --------------- afr Afrikaans afr.traineddata AFRアフリカーンス語 afr.traineddata amh Amharic amh.traineddata ああアムハラ語 amh.traineddata ara Arabic ara.traineddata あらアラビア語 ara.traineddata asm Assamese asm.traineddata ASM アッサムasm.traineddata aze Azerbaijani aze.traineddata あぜアゼルバイジャン語 aze.traineddata aze_cyrl Azerbaijani - Cyrillic aze_cyrl.traineddata aze_cyrl アゼルバイジャン語 - キリル文字 aze_cyrl.traineddata bel Belarusian bel.traineddata ベル ベラルーシ語bel.traineddata ben Bengali ben.traineddata ベン ベンガル語ben.traineddata bod Tibetan bod.traineddata ボディーチベットbod.traineddata bos Bosnian bos.traineddata ボスボスニア語 bos.traineddata bul Bulgarian bul.traineddata bul ブルガリア語 bul.traineddata cat Catalan; Valencian cat.traineddata 猫カタロニア語バレンシアcat.traineddata ceb Cebuano ceb.traineddata ceb セブアノceb.traineddata ces Czech ces.traineddata ces チェコces.traineddata chi_sim Chinese - Simplified chi_sim.traineddata chi_sim 中国語 - 簡体字 chi_sim.traineddata chi_tra Chinese - Traditional chi_tra.traineddata chi_tra 繁体字中国語chi_tra.traineddata chr Cherokee chr.traineddata chr チェロキーchr.traineddata cym Welsh cym.traineddata cym ウェールズ語 cym.traineddata dan Danish dan.traineddata ダン デンマーク語 dan.traineddata deu German deu.traineddata デウドイツ語 deu.traineddata dzo Dzongkha dzo.traineddata dzoゾンカdzo.traineddata ell Greek, Modern (1453-) ell.traineddata ell ギリシャ語、モダン(1453-) ell.traineddata eng English eng.traineddata eng 英語 eng.traineddata enm English, Middle (1100-1500) enm.traineddata enm 英語、中(1100 - 1500) enm.traineddata epo Esperanto epo.traineddata エポエスペラントepo.traineddata est Estonian est.traineddata 最新 エストニア語 est.traineddata eus Basque eus.traineddata ユー バスクeus.traineddata fas Persian fas.traineddata fasペルシャ語 fas.traineddata fin Finnish fin.traineddata ひれフィンランド語fin.traineddata fra French fra.traineddata fra フランス語 fra.traineddata frk Frankish frk.traineddata frk フランキー語frk.traineddata frm French, Middle (ca. 1400-1600) frm.traineddata frm フランス語、中級(約1400-1600) frm.traineddata gle Irish gle.traineddata グレアイルランドgle.traineddata glg Galician glg.traineddata glg ガリシア語glg.traineddata grc Greek, Ancient (-1453) grc.traineddata grc ギリシャ語、古代(-1453) grc.traineddata guj Gujarati guj.traineddata guj グジャラート語 guj.traineddata hat Haitian; Haitian Creole hat.traineddata 帽子ハイチ語ハイチクレオールhat.traineddata heb Hebrew heb.traineddata ヘブヘブライ語 heb.traineddata hin Hindi hin.traineddata ひんヒンディー語 hin.traineddata hrv Croatian hrv.traineddata hrv クロアチア語 hrv.traineddata hun Hungarian hun.traineddata フンハンガリー語hun.traineddata iku Inuktitut iku.traineddata イクイヌクティットiku.traineddata ind Indonesian ind.traineddata ind インドネシア語 ind.traineddata isl Icelandic isl.traineddata isl アイスランド語 isl.traineddata ita Italian ita.traineddata イタイタリア語 ita.traineddata ita_old Italian - Old ita_old.traineddata ita_old イタリア語 - 古いita_old.traineddata jav Javanese jav.traineddata Jav Javジャワjav.traineddata jpn Japanese jpn.traineddata jpn 日本語 jpn.traineddata kan Kannada kan.traineddata かんカンナダkan.traineddata kat Georgian kat.traineddata キャットグルジア語 kat.traineddata kat_old Georgian - Old kat_old.traineddata kat_old グルジア語 - 古いkat_old.traineddata kaz Kazakh kaz.traineddata カズカザフkaz.traineddata khm Central Khmer khm.traineddata khmセントラルクメールkhm.traineddata kir Kirghiz; Kyrgyz kir.traineddata キルキルギスキルギスkir.traineddata kor Korean kor.traineddata コ 韓国語 kor.traineddata kur Kurdish kur.traineddata クルクルド人kur.traineddata lao Lao lao.traineddata ラオスラオスlao.traineddata lat Latin lat.traineddata 緯度ラテン語 lat.traineddata lav Latvian lav.traineddata ラヴラトビア語lav.traineddata lit Lithuanian lit.traineddata 点灯 リトアニア語lit.traineddata mal Malayalam mal.traineddata Mal マラヤーラム語mal.traineddata mar Marathi mar.traineddata 3月マラーティーmar.traineddata mkd Macedonian mkd.traineddata mkd マケドニア語mkd.traineddata mlt Maltese mlt.traineddata mlt マルタmlt.traineddata msa Malay msa.traineddata msa マレー msa.traineddata mya Burmese mya.traineddata ミアビルマmya.traineddata nep Nepali nep.traineddata ネップネパールnep.traineddata nld Dutch; Flemish nld.traineddata nld オランダの;フランドルnld.traineddata nor Norwegian nor.traineddata またノルウェー語 nor.traineddata ori Oriya ori.traineddata オリ オリヤori.traineddata pan Panjabi; Punjabi pan.traineddata パン パンジャブ語パンジャブpan.traineddata pol Polish pol.traineddata pol ポーランド語 pol.traineddata por Portuguese por.traineddata por ポルトガル語 por.traineddata pus Pushto; Pashto pus.traineddata 膿プッシューパシュトウpus.traineddata ron Romanian; Moldavian; Moldovan ron.traineddata ロンルーマニア語モルダビアンモルドバron.traineddata rus Russian rus.traineddata rus ロシア語 rus.traineddata san Sanskrit san.traineddata さんサンスクリットsan.traineddata sin Sinhala; Sinhalese sin.traineddata 罪シンハラ語シンハラsin.traineddata slk Slovak slk.traineddata slk スロバキアslk.traineddata slv Slovenian slv.traineddata slv スロベニア語slv.traineddata spa Spanish; Castilian spa.traineddata スパスペイン語カスティーリャspa.traineddata spa_old Spanish; Castilian - Old spa_old.traineddata spa_old スペイン語カスティーリャ - オールド spa_old.traineddata sqi Albanian sqi.traineddata sqi アルバニア語 sqi.traineddata srp Serbian srp.traineddata srp セルビア語 srp.traineddata srp_latn Serbian - Latin srp_latn.traineddata srp_latn セルビア語 - ラテン語 srp_latn.traineddata swa Swahili swa.traineddata スワスワヒリ語 swa.traineddata swe Swedish swe.traineddata 汗スウェーデン語 swe.traineddata syr Syriac syr.traineddata syr シリアsyr.traineddata tam Tamil tam.traineddata タムタミル語tam.traineddata tel Telugu tel.traineddata tel テルグ語tel.traineddata tgk Tajik tgk.traineddata tgk タジクtgk.traineddata tgl Tagalog tgl.traineddata tgl タガログ語 tgl.traineddata tha Thai tha.traineddata tha タイ語 tha.traineddata tir Tigrinya tir.traineddata ティルティグリニャtir.traineddata tur Turkish tur.traineddata tur トルコ語 tur.traineddata uig Uighur; Uyghur uig.traineddata ウィッグウイグル語ウイグルuig.traineddata ukr Ukrainian ukr.traineddata イギリスウクライナ語 ukr.traineddata urd Urdu urd.traineddata urd ウルドゥー語urd.traineddata uzb Uzbek uzb.traineddata uzb ウズベク語uzb.traineddata uzb_cyrl Uzbek - Cyrillic uzb_cyrl.traineddata uzb_cyrl ウズベキスタン - キリル文字 uzb_cyrl.traineddata vie Vietnamese vie.traineddata 争うベトナム人 vie.traineddata yid Yiddish yid.traineddata イードイディッシュ語yid.traineddata ## Cube Data Files for Version 3.04/3.05 ##バージョン3.04 / 3.05用のキューブデータファイル In Tesseract 3.0x Arabic and Hindi use the Cube OCR engine. You need to download the cube files and move them to the same folder where the ara/hin .traineddata file is located. Tesseract 3.0xでは、アラビア語とヒンディー語はCube OCRエンジンを使用します。キューブファイルをダウンロードして、それらを ara / hin .traineddataファイルと同じフォルダーに移動する必要があります。 In Tesseract 4.0 the Cube OCR engine was removed from the codebase, so if you are using 4.0 or a newer version these files are not needed. Tesseract 4.0では、Cube OCRエンジンはコードベースから削除されたため、4.0以降のバージョンを使用している場合、これらのファイルは必要ありません。 Hindi ヒンディー語 hin.cube.bigrams, hin.cube.bigrams、 hin.cube.fold, hin.cube.fold、 hin.cube.lm, hin.cube.lm、 hin.cube.nn, hin.cube.nn、 hin.cube.params, hin.cube.params、 hin.cube.word-freq, hin.cube.word-freq、 hin.tesseract_cube.nn hin.tesseract_cube.nn Arabic アラビア語 ara.cube.bigrams, ara.cube.bigrams、 ara.cube.fold, ara.cube.fold、 ara.cube.lm, ara.cube.lm、 ara.cube.nn, ara.cube.nn、 ara.cube.params, ara.cube.params、 ara.cube.word-freq, ara.cube.word-freq、 ara.cube.size, ara.cube.size、 ara.tesseract_cube.nn ara.tesseract_cube.nn ## Fraktur Data Files ## Frakturデータファイル These data files were prepared by @paalberti for some old versions of Tesseract. dan_frak, deu_frak and swe_frak were prepared for version 3.00, slk_frak was prepared for 3.01. Updates to these files are available at paalberti/tesseract-dan-fraktur. これらのデータファイルは、Tesseractの古いバージョン用に@paalbertiによって作成されました。 dan_frak、deu_frakおよび swe_frakはバージョン3.00用に準備され、slk_frakは3.01用に準備されました。これらのファイルの更新はpaalberti / tesseract-dan-frakturで入手できます。 Lang Code Language 3.0x traineddata ラングコード 言語 3.0xトレーニング済みデータ -------- ------- ---------------- -------- ------- ---------------- dan_frak Danish - Fraktur dan_frak.traineddata dan_frak デンマーク語 - Fraktur dan_frak.traineddata deu_frak German - Fraktur deu_frak.traineddata deu_frak ドイツ語 - Fraktur deu_frak.traineddata slk_frak Slovak - Fraktur slk_frak.traineddata slk_frak スロバキア - Fraktur slk_frak.traineddata swe_frak Swedish - Fraktur swe-frak.traineddata swe_frak スウェーデン語 - Fraktur swe-frak.traineddata ## Data Files for Version 3.02 ##バージョン3.02用のデータファイル Lang Code Language 3.02 traineddata ラングコード 言語 3.02トレーニングデータ -------- ------- ---------------- -------- ------- ---------------- afr Afrikaans tesseract-ocr-3.02.afr.tar.gz AFRアフリカーンス語 tesseract-ocr-3.02.afr.tar.gz ara Arabic tesseract-ocr-3.02.ara.tar.gz あらアラビア語 tesseract-ocr-3.02.ara.tar.gz aze Azerbaijani tesseract-ocr-3.02.aze.tar.gz あぜアゼルバイジャン語 tesseract-ocr-3.02.aze.tar.gz bel Belarusian tesseract-ocr-3.02.bel.tar.gz ベル ベラルーシ語tesseract-ocr-3.02.bel.tar.gz ben Bengali tesseract-ocr-3.02.ben.tar.gz ベン ベンガル語tesseract-ocr-3.02.ben.tar.gz bul Bulgarian tesseract-ocr-3.02.bul.tar.gz bul ブルガリア語 tesseract-ocr-3.02.bul.tar.gz cat Catalan; Valencian tesseract-ocr-3.02.cat.tar.gz 猫カタロニア語バレンシアtesseract-ocr-3.02.cat.tar.gz ces Czech tesseract-ocr-3.02.ces.tar.gz ces チェコtesseract-ocr-3.02.ces.tar.gz chi_sim Chinese - Simplified tesseract-ocr-3.02.chi_sim.tar.gz chi_sim 中国語 - 簡体字 tesseract-ocr-3.02.chi_sim.tar.gz chi_tra Chinese - Traditional tesseract-ocr-3.02.chi_tra.tar.gz chi_tra 繁体字中国語tesseract-ocr-3.02.chi_tra.tar.gz chr Cherokee tesseract-ocr-3.02.chr.tar.gz chr チェロキーtesseract-ocr-3.02.chr.tar.gz dan Danish tesseract-ocr-3.02.dan.tar.gz ダン デンマーク語 tesseract-ocr-3.02.dan.tar.gz deu German tesseract-ocr-3.02.deu.tar.gz デウドイツ語 tesseract-ocr-3.02.deu.tar.gz ell Greek, Modern (1453-) tesseract-ocr-3.02.ell.tar.gz ell ギリシャ語、モダン(1453-) tesseract-ocr-3.02.ell.tar.gz eng English tesseract-ocr-3.02.eng.tar.gz eng 英語 tesseract-ocr-3.02.eng.tar.gz enm English, Middle (1100-1500) tesseract-ocr-3.02.enm.tar.gz enm 英語、中(1100 - 1500) tesseract-ocr-3.02.enm.tar.gz epo Esperanto tesseract-ocr-3.02.epo.tar.gz エポエスペラントtesseract-ocr-3.02.epo.tar.gz est Estonian tesseract-ocr-3.02.est.tar.gz 最新 エストニア語 tesseract-ocr-3.02.est.tar.gz eus Basque tesseract-ocr-3.02.eus.tar.gz ユー バスクtesseract-ocr-3.02.eus.tar.gz fin Finnish tesseract-ocr-3.02.fin.tar.gz ひれフィンランド語tesseract-ocr-3.02.fin.tar.gz fra French tesseract-ocr-3.02.fra.tar.gz fra フランス語 tesseract-ocr-3.02.fra.tar.gz frk Frankish tesseract-ocr-3.02.frk.tar.gz frk フランキー語tesseract-ocr-3.02.frk.tar.gz frm French, Middle (ca. 1400-1600) tesseract-ocr-3.02.frm.tar.gz frm フランス語、中級(約1400-1600) tesseract-ocr-3.02.frm.tar.gz glg Galician tesseract-ocr-3.02.glg.tar.gz glg ガリシア語tesseract-ocr-3.02.glg.tar.gz grc Greek, Ancient (-1453) tesseract-ocr-3.02.grc.tar.gz grc ギリシャ語、古代(-1453) tesseract-ocr-3.02.grc.tar.gz heb Hebrew tesseract-ocr-3.02.heb.tar.gz ヘブヘブライ語 tesseract-ocr-3.02.heb.tar.gz hin Hindi tesseract-ocr-3.02.hin.tar.gz ひんヒンディー語 tesseract-ocr-3.02.hin.tar.gz hrv Croatian tesseract-ocr-3.02.hrv.tar.gz hrv クロアチア語 tesseract-ocr-3.02.hrv.tar.gz hun Hungarian tesseract-ocr-3.02.hun.tar.gz フンハンガリー語tesseract-ocr-3.02.hun.tar.gz ind Indonesian tesseract-ocr-3.02.ind.tar.gz ind インドネシア語 tesseract-ocr-3.02.ind.tar.gz isl Icelandic tesseract-ocr-3.02.isl.tar.gz isl アイスランド語 tesseract-ocr-3.02.isl.tar.gz ita Italian tesseract-ocr-3.02.ita.tar.gz イタイタリア語 tesseract-ocr-3.02.ita.tar.gz ita_old Italian - Old tesseract-ocr-3.02.ita_old.tar.gz ita_old イタリア語 - 古いtesseract-ocr-3.02.ita_old.tar.gz jpn Japanese tesseract-ocr-3.02.jpn.tar.gz jpn 日本語 tesseract-ocr-3.02.jpn.tar.gz kan Kannada tesseract-ocr-3.02.kan.tar.gz かんカンナダtesseract-ocr-3.02.kan.tar.gz kor Korean tesseract-ocr-3.02.kor.tar.gz コ 韓国語 tesseract-ocr-3.02.kor.tar.gz lav Latvian tesseract-ocr-3.02.lav.tar.gz ラヴラトビア語tesseract-ocr-3.02.lav.tar.gz lit Lithuanian tesseract-ocr-3.02.lit.tar.gz 点灯 リトアニア語tesseract-ocr-3.02.lit.tar.gz mal Malayalam tesseract-ocr-3.02.mal.tar.gz Mal マラヤーラム語tesseract-ocr-3.02.mal.tar.gz mkd Macedonian tesseract-ocr-3.02.mkd.tar.gz mkd マケドニア語tesseract-ocr-3.02.mkd.tar.gz mlt Maltese tesseract-ocr-3.02.mlt.tar.gz mlt マルタtesseract-ocr-3.02.mlt.tar.gz msa Malay tesseract-ocr-3.02.msa.tar.gz msa マレー tesseract-ocr-3.02.msa.tar.gz nld Dutch; Flemish tesseract-ocr-3.02.nld.tar.gz nld オランダの;フランドルtesseract-ocr-3.02.nld.tar.gz nor Norwegian tesseract-ocr-3.02.nor.tar.gz またノルウェー語 tesseract-ocr-3.02.nor.tar.gz pol Polish tesseract-ocr-3.02.pol.tar.gz pol ポーランド語 tesseract-ocr-3.02.pol.tar.gz por Portuguese tesseract-ocr-3.02.por.tar.gz por ポルトガル語 tesseract-ocr-3.02.por.tar.gz ron Romanian; Moldavian; Moldovan tesseract-ocr-3.02.ron.tar.gz ロンルーマニア語モルダビアンモルドバtesseract-ocr-3.02.ron.tar.gz rus Russian tesseract-ocr-3.02.rus.tar.gz rus ロシア語 tesseract-ocr-3.02.rus.tar.gz slk Slovak tesseract-ocr-3.02.slk.tar.gz slk スロバキアtesseract-ocr-3.02.slk.tar.gz slv Slovenian tesseract-ocr-3.02.slv.tar.gz slv スロベニア語tesseract-ocr-3.02.slv.tar.gz spa Spanish; Castilian tesseract-ocr-3.02.spa.tar.gz スパスペイン語カスティーリャtesseract-ocr-3.02.spa.tar.gz spa_old Spanish; Castilian - Old tesseract-ocr-3.02.spa_old.tar.gz spa_old スペイン語カスティーリャ - オールド tesseract-ocr-3.02.spa_old.tar.gz sqi Albanian tesseract-ocr-3.02.sqi.tar.gz sqi アルバニア語 tesseract-ocr-3.02.sqi.tar.gz srp Serbian tesseract-ocr-3.02.srp.tar.gz srp セルビア語 tesseract-ocr-3.02.srp.tar.gz swa Swahili tesseract-ocr-3.02.swa.tar.gz スワスワヒリ語 tesseract-ocr-3.02.swa.tar.gz swe Swedish tesseract-ocr-3.02.swe.tar.gz 汗スウェーデン語 tesseract-ocr-3.02.swe.tar.gz tam Tamil tesseract-ocr-3.02.tam.tar.gz タムタミル語tesseract-ocr-3.02.tam.tar.gz tel Telugu tesseract-ocr-3.02.tel.tar.gz tel テルグ語tesseract-ocr-3.02.tel.tar.gz tgl Tagalog tesseract-ocr-3.02.tgl.tar.gz tgl タガログ語 tesseract-ocr-3.02.tgl.tar.gz tha Thai tesseract-ocr-3.02.tha.tar.gz tha タイ語 tesseract-ocr-3.02.tha.tar.gz tur Turkish tesseract-ocr-3.02.tur.tar.gz tur トルコ語 tesseract-ocr-3.02.tur.tar.gz ukr Ukrainian tesseract-ocr-3.02.ukr.tar.gz イギリスウクライナ語 tesseract-ocr-3.02.ukr.tar.gz vie Vietnamese tesseract-ocr-3.02.vie.tar.gz 争うベトナム人 tesseract-ocr-3.02.vie.tar.gz ## Data Files for Version 2.0x ##バージョン2.0x用のデータファイル Lang Code Language 2.0x traineddata ラングコード 言語 2.0xトレーニング済みデータ -------- ------- ---------------- -------- ------- ---------------- deu German tesseract-2.00.deu.tar.gz デウドイツ語 tesseract-2.00.deu.tar.gz deu-f German - Fraktur tesseract-2.01.deu-f.tar.gz deu-f ドイツ語 - Fraktur tesseract-2.01.deu-f.tar.gz eng English tesseract-2.00.eng.tar.gz eng 英語 tesseract-2.00.eng.tar.gz eus Basque tesseract-2.04-eus.tar.gz ユー バスクtesseract-2.04-eus.tar.gz fra French tesseract-2.00.fra.tar.gz fra フランス語 tesseract-2.00.fra.tar.gz ita Italian tesseract-2.00.ita.tar.gz イタイタリア語 tesseract-2.00.ita.tar.gz nld Dutch; Flemish tesseract-2.00.nld.tar.gz nld オランダの;フランドルtesseract-2.00.nld.tar.gz por Portuguese tesseract-2.01.por.tar.gz por ポルトガル語 tesseract-2.01.por.tar.gz spa Spanish; Castilian tesseract-2.00.spa.tar.gz スパスペイン語カスティーリャtesseract-2.00.spa.tar.gz vie Vietnamese tesseract-2.01.vie.tar.gz 争うベトナム人 tesseract-2.01.vie.tar.gz ## Format of traineddata files ##訓練されたデータファイルのフォーマット The traineddata file for each language is an archive file in a Tesseract specific format. It contains several uncompressed component files which are needed by the Tesseract OCR process. The program combine_tessdata is used to create a tessdata file from the component files and can also extract them again like in the following examples 各言語の traineddataファイルはTesseract特有のフォーマットのアーカイブファイルです。それはTesseract OCRプロセスによって必要とされるいくつかの非圧縮コンポーネントファイルを含みます。プログラム combine_tessdataは、コンポーネントファイルからtessdataファイルを作成するのに使われていて、以下の例のようにそれらを再び抽出することもできます ### Pre 4.0.0 format from Nov 2016 (with both LSTM and Legacy models) 2016年11月からの###プレ4.0.0フォーマット(LSTMとLegacyの両方のモデルを含む) ` | ` combine_tessdata -u eng.traineddata eng. combine_tessdata -u eng.traineddata eng。 Extracting tessdata components from eng.traineddata eng.traineddataからのtessdataコンポーネントの抽出 Wrote eng.unicharset eng.unicharsetを書き込みました Wrote eng.unicharambigs eng.unicharambigsを書きました Wrote eng.inttemp eng.inttempを書きました Wrote eng.pffmtable eng.pffmtableを書きました Wrote eng.normproto eng.normprotoを書きました Wrote eng.punc-dawg eng.punc-dawgを書きました Wrote eng.word-dawg eng.word-dawgを書いた。 Wrote eng.number-dawg eng.number-dawgを書き込みました Wrote eng.freq-dawg eng.freq-dawgを書き込みました Wrote eng.cube-unicharset eng.cube-unicharsetを書き込みました Wrote eng.cube-word-dawg eng.cube-word-dawgを書き込みました Wrote eng.shapetable eng.shapetableを書き込みました Wrote eng.bigram-dawg eng.bigram-dawgを書きました Wrote eng.lstm 英語を書く Wrote eng.lstm-punc-dawg eng.lstm-punc-dawgを書き込みました Wrote eng.lstm-word-dawg eng.lstm-word-dawgを書き込みました Wrote eng.lstm-number-dawg eng.lstm-number-dawgを書き込みました。 Wrote eng.version eng.versionを書きました Version string Pre-4.0.0 バージョン文字列 4.0.0以前 1 unicharset size=7477, offset=192 1 ユニセット サイズ= 7477、オフセット= 192 2 unicharambigs size=1047, offset=7669 2 unicharambigs サイズ= 1047、オフセット= 7669 3 inttemp size=976552, offset=8716 3 inttemp size = 976552、offset = 8716 4 pffmtable size=844, offset=985268 4 pffmtable サイズ= 844、オフセット= 985268 5 normproto size=13408, offset=986112 5 normproto サイズ= 13408、オフセット= 986112 6 punc-dawg size=4322, offset=999520 6 punc-dawg サイズ= 4322、オフセット= 999520 7 word-dawg size=1082890, offset=1003842 7 単語 - 夜明け サイズ= 1082890、オフセット= 1003842 8 number-dawg size=6426, offset=2086732 8 number-dawg サイズ= 6426、オフセット= 2086732 9 freq-dawg size=1410, offset=2093158 9 freq-dawg サイズ= 1410、オフセット= 2093158 11 cube-unicharset size=1511, offset=2094568 11 立方ユニキャスト サイズ= 1511、オフセット= 2094568 12 cube-word-dawg size=1062106, offset=2096079 12 cube-word-dawg サイズ= 1062106、オフセット= 2096079 13 shapetable size=63346, offset=3158185 13 シェイプテーブル サイズ= 63346、オフセット= 3158185 14 bigram-dawg size=16109842, offset=3221531 14 bigram-dawg サイズ= 16109842、オフセット= 3221531 17 lstm size=5390718, offset=19331373 17 lstm サイズ= 5390718、オフセット= 19331373 18 lstm-punc-dawg size=4322, offset=24722091 18 lstm-punc-dawg サイズ= 4322、オフセット= 24722091 19 lstm-word-dawg size=7143578, offset=24726413 19 lstm-word-dawg サイズ= 7143578、オフセット= 24726413 20 lstm-number-dawg size=3530, offset=31869991 20 lstm-number-dawg サイズ= 3530、オフセット= 31869991 23 version size=9, offset=31873521 23 バージョン サイズ= 9、オフセット= 31873521 ` | ` ### 4.00.00alpha LSTM only format ### 4.00.00alpha LSTMのみのフォーマット ` | ` combine_tessdata -u eng.traineddata eng. combine_tessdata -u eng.traineddata eng。 Extracting tessdata components from eng.traineddata eng.traineddataからのtessdataコンポーネントの抽出 Wrote eng.lstm 英語を書く Wrote eng.lstm-punc-dawg eng.lstm-punc-dawgを書き込みました Wrote eng.lstm-word-dawg eng.lstm-word-dawgを書き込みました Wrote eng.lstm-number-dawg eng.lstm-number-dawgを書き込みました。 Wrote eng.lstm-unicharset eng.lstm-unicharsetを書き込みました Wrote eng.lstm-recoder eng.lstm-recoderを書きました Wrote eng.version eng.versionを書きました Version string 4.00.00alpha eng synth20170629 [1,36,0,1Ct3,3,16Mp3,3Lfys64Lfx96Lrx96Lfx512O1c1] バージョン文字列 4.00.00alpha eng synth20170629 [1,36,0,1Ct3,3,16Mp3,3Lfys64Lfx96Lrx96Lfx512O1c1] 17 lstm size=11689099, offset=192 17 lstm サイズ= 11689099、オフセット= 192 18 lstm-punc-dawg size=4322, offset=11689291 18 lstm-punc-dawg サイズ= 4322、オフセット= 11689291 19 lstm-word-dawg size=3694794, offset=11693613 19 lstm-word-dawg サイズ= 3694794、オフセット= 11693613 20 lstm-number-dawg size=4738, offset=15388407 20 lstm-number-dawg サイズ= 4738、オフセット= 15388407 21 lstm-unicharset size=6360, offset=15393145 21 lstm-unicharset size = 6360、offset = 15393145 22 lstm-recoder size=1012, offset=15399505 22 lstmレコーダ サイズ= 1012、オフセット= 15399505 23 version size=80, offset=15400517 23 バージョン サイズ= 80、オフセット= 15400517 ` | ` ### Proposal for compressed traineddata files ###圧縮トレーニングデータファイルの提案 There are some proposals to replace the Tesseract archive format by a standard archive format which could also support compression. A [discussion on the tesseract-dev forum](https //groups.google.com/forum/?hl=en#!searchin/tesseract-dev/zip sort date/tesseract-dev/U5HSugUeeeI) proposed the ZIP format already in 2014. In 2017 an experimental implementation was provided as a pull request. Tesseractアーカイブ形式を、圧縮をサポートすることもできる標準アーカイブ形式に置き換える提案がいくつかあります。 [tesseract-devフォーラムでの議論](https //groups.google.com/forum/?hl=en#!searchin/tesseract-dev/zip sort date/tesseract-dev/U5HSugUeeeI)がZIPを提案しましたフォーマットはすでに2014年にあります。2017年には、実験的実装がプルリクエストとして提供されました。